智能论文笔记

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

BERTIN: Efficient Pre-Training of a Spanish Language Model using Perplexity Sampling

Javier de la Rosa , Eduardo G. Ponferrada , Paulo Villegas , Pablo Gonzalez de Prado Salas , Manu Romero , Marıa Grandury

分类：自然语言处理 | 人工智能

2022-07-14

在计算和数据方面，大型语言模型的预培训通常需要大量资源。经常使用的Web源（例如Common Crawl）可能包含足够的噪声，以使这种预训练的亚地区。在这项工作中，我们尝试了西班牙语版本的MC4的不同采样方法，并提出了一种新颖的以数据为中心的技术，我们将其命名为$ \ textit {Perplexity sampling} $，该技术可实现大约一半的语言模型的预培训步骤并使用五分之一的数据。最终的模型与当前的最新机构相当，甚至可以为某些任务获得更好的结果。我们的工作证明了变形金刚的多功能性，并为小型团队以有限的预算培训模型铺平了道路。我们的型号可在此$ \ href {https://huggingface.co/bertin-project} {url} $中获得。

translated by 谷歌翻译

Dressing Avatars: Deep Photorealistic Appearance for Physically Simulated Clothing

Donglai Xiang , Timur Bagautdinov , Tuur Stuyck , Fabian Prada , Javier Romero , Weipeng Xu , Shunsuke Saito , Jingfan Guo , Breannan Smith , Takaaki Shiratori

分类：计算机视觉

2022-06-30

尽管最近在开发动画全身化身方面取得了进展，但服装的现实建模（人类自我表达的核心方面之一）仍然是一个开放的挑战。最先进的物理模拟方法可以以交互速度产生现实行为的服装几何形状。但是，建模光真逼真的外观通常需要基于物理的渲染，这对于交互式应用来说太昂贵了。另一方面，数据驱动的深度外观模型能够有效地产生逼真的外观，但在合成高度动态服装的几何形状和处理具有挑战性的身体套构型方面挣扎。为此，我们通过对服装的明确建模介绍了姿势驱动的化身，这些化身表现出逼真的服装动力学和从现实世界数据中学到的逼真的外观。关键的想法是引入一个在显式几何形状之上运行的神经服装外观模型：在火车时，我们使用高保真跟踪，而在动画时期，我们依靠物理模拟的几何形状。我们的关键贡献是一个具有物理启发的外观网络，能够生成具有视图依赖性和动态阴影效果的影像逼真的外观，即使对于看不见的身体透明构型也是如此。我们对我们的模型进行了彻底的评估，并在几种受试者和不同类型的衣服上展示了不同的动画结果。与以前关于影迷全身化身的工作不同，我们的方法甚至可以为宽松的衣服产生更丰富的动力和更现实的变形。我们还证明，我们的配方自然允许服装与不同人的头像一起使用，同时保持完全动画，因此首次可以采用新颖的衣服来实现逼真的化身。

translated by 谷歌翻译

plingo: A system for probabilistic reasoning in clingo based on lpmln

Susana Hahn , Tomi Janhunen , Roland Kaminski , Javier Romero , Nicolas Rühling , Torsten Schaub

分类：人工智能

2022-06-23

我们提出Plingo，这是具有各种概率推理模式的ASP系统clingo的扩展。Plingo以Lp^mln为中心，Lp^mln是基于Markov Logic的权重方案的ASP的概率扩展。这种选择是由于可以将核心概率推理模式映射到优化问题的事实而动机，并且LP^mln可以用作与其他概率方法相关的中间地形式主义。结果，Plingo为Lp^mln，P-Log和Problog提供了三个替代前端。相应的输入语言和推理模式是通过Clingo的多拍和理论解决功能来实现的。pling脚的核心等于在现代ASP技术方面重新实现LP^mln，并以一种基于新方法以最佳顺序进行答案集枚举的近似技术扩展。我们通过将Plingo的性能与其他概率系统进行比较，从经验上评估。

translated by 谷歌翻译

Body Gesture Recognition to Control a Social Robot

Javier Laplaza , Joan Jaume Oliver , Ramón Romero , Alberto Sanfeliu , Anaís Garrell

分类：机器人 | 计算机视觉 | 机器学习

2022-06-15

在这项工作中，我们提出了一种基于手势的语言，以允许人类以自然的方式与机器人互动。我们已经使用神经网络和一个自定义的人类数据集创建了一个新的手势检测模型，该数据集执行一组身体手势来训练我们的网络。此外，我们将身体手势通信与其他沟通渠道进行比较，以确认将这些知识添加到机器人的重要性。在非训练志愿者的不同模拟和现实生活实验中，对所提出的方法进行了广泛的验证。这取得了显着的结果，并表明它是社会机器人应用程序（例如人类机器人协作或人类机器人互动）的宝贵框架。

translated by 谷歌翻译

Embodied Hands: Modeling and Capturing Hands and Bodies Together

Javier Romero , Dimitrios Tzionas , Michael J. Black

分类：计算机视觉

2022-01-07

人类将他们的手和身体一起移动，沟通和解决任务。捕获和复制此类协调活动对于虚拟字符至关重要，以实际行为行为。令人惊讶的是，大多数方法分别对待身体和手的3D建模和跟踪。在这里，我们制定了一种手和身体的型号，并将其与全身4D序列合理。当扫描或捕获3D中的全身时，手很小，通常是部分闭塞，使其形状和难以恢复。为了应对低分辨率，闭塞和噪音，我们开发了一种名为Mano（具有铰接和非刚性变形的手模型）的新型号。曼诺从大约1000个高分辨率的3D扫描中学到了31个受试者的手中的大约一定的手。该模型是逼真的，低维，捕获非刚性形状的姿势变化，与标准图形封装兼容，可以适合任何人类的手。 Mano提供从手姿势的紧凑型映射，以构成混合形状校正和姿势协同效应的线性歧管。我们将Mano附加到标准参数化3D体形状模型（SMPL），导致完全铰接的身体和手部模型（SMPL + H）。我们通过用4D扫描仪捕获的综合体，自然，自然，自然的受试者的活动来说明SMPL + H.该配件完全自动，并导致全身型号，自然地移动详细的手动运动和在全身性能捕获之前未见的现实主义。模型和数据在我们的网站上自由用于研究目的（http://mano.is.tue.mpg.de）。

translated by 谷歌翻译

Answer Set Programming Made Easy

Jorge Fandinno , Seemran Mishra , Javier Romero , Torsten Schaub

分类：人工智能

2021-11-11

我们从答案集编程的民间传说中占据了一个想法，即选择，完整性约束以及限制规则格式足以回答集编程。我们在这里的逻辑的背景下详细说明了这个想法的基础，并展示了如何通过定义从扩展的逻辑原则派生。然后，我们提供了一种AUSTERE形式的逻辑程序，可以用作类似于古典逻辑中的联合常规表的逻辑程序的正常形态。最后，我们采取关键的想法，并为ASP初学者提出建模方法，并说明如何使用它。

translated by 谷歌翻译

How to build your own ASP-based system?!

Roland Kaminski , Javier Romero , Torsten Schaub , Philipp Wanko

分类：人工智能

2020-08-15

回答集编程（ASP）已成为一种流行的和相当复杂的声明问题解决方法。这是由于其具有吸引力的地址解决方案的工作流程，这是可以轻松解决问题解决的方法，即使对于计算机科学外的守护者而言。与此不同，底层技术的高度复杂性使得ASP专家越来越难以将想法付诸实践。有关解决此问题，本教程旨在使用户能够构建自己的基于ASP的系统。更确切地说，我们展示了ASP系统Clingo如何用于扩展ASP和实现定制的专用系统。为此，我们提出了两个替代方案。我们从传统的AI技术开始，并展示元编程如何用于扩展ASP。这是一种相当轻的方法，依赖于Clingo的reation特征来使用ASP本身表达新功能。与此不同，本教程的主要部分使用传统的编程（在Python中）来通过其应用程序编程接口操纵Clingo。这种方法允许改变和控制ASP的整个模型 - 地面解决工作流程。 COMENT of Clingo的新应用程序课程使我们能够通过自定义类似于Clingo中的进程来绘制Clingo的基础架构。例如，我们可能会互动到程序的抽象语法树，控制各种形式的多射击求解，并为外国推论设置理论传播者。另一种横截面结构，跨越元以及应用程序编程是Clingo的中间格式，即指定底层接地器和求解器之间的界面。我们通过示例和几个非琐碎的案例研究说明了本教程的前述概念和技术。

translated by 谷歌翻译

Deep Learning Based Detection and Localization of Intracranial Aneurysms in Computed Tomography Angiography

Dufan Wu , Daniel Montes , Ziheng Duan , Yangsibo Huang , Javier M. Romero , Ramon Gilberto Gonzalez , Quanzheng Li

分类：计算机视觉 | 机器学习

2020-05-22

目的：要开发CADIA，一种基于区域提案网络的监督深度学习模型，耦合具有针对计算机断层造影（CTA）颅内动脉瘤（IA）的假阳性减少模块，并评估我们的模型的性能到类似的检测网络。方法：在此回顾性研究中，我们评估了来自两种独立的疾病患者的两种单独的患者患者的囊性IA> = 2.5mm。实施了两步模型：用于初始动脉瘤检测的3D区域提案网络，以及3D DENSENETSFOR虚假阳性降低以及对可疑IA的进一步确定。还进行了自由响应接收器操作特征（FROC）曲线和患者级性能，在既定的假每体积（FPPV）时呈现出误报。 Fisher的确切测试用于与类似的可用模型进行比较。结果：0.25和1 FPPV的Cadia的敏感性分别为63.9％和77.5％。我们的模型的性能随着尺寸和位置而变化，最佳性能是在5-10毫米和前沟通动脉的含量，敏感性分别为95.8％和94％的敏感性。与0.25 FPPV的可用型号相比，我们的模型显示出统计学上更高的患者级精度，灵敏度和特异性。在1 FPPV阈值下，我们的模型显示出更好的准确性和特异性（P <= 0.001）和等效灵敏度。结论：CADIA在IA的检测任务中表现出可比网络。添加假阳性还原模块是改善IA检测模型的可行步骤。

translated by 谷歌翻译

A simple yet effective baseline for 3d human pose estimation

Julieta Martinez , Rayat Hossain , Javier Romero , James J. Little

分类：

2017-05-08

Following the success of deep convolutional networks, state-of-the-art methods for 3d human pose estimation have focused on deep end-to-end systems that predict 3d joint locations given raw image pixels. Despite their excellent performance, it is often not easy to understand whether their remaining error stems from a limited 2d pose (visual) understanding, or from a failure to map 2d poses into 3dimensional positions.With the goal of understanding these sources of error, we set out to build a system that given 2d joint locations predicts 3d positions. Much to our surprise, we have found that, with current technology, "lifting" ground truth 2d joint locations to 3d space is a task that can be solved with a remarkably low error rate: a relatively simple deep feedforward network outperforms the best reported result by about 30% on Human3.6M, the largest publicly available 3d pose estimation benchmark. Furthermore, training our system on the output of an off-the-shelf state-of-the-art 2d detector (i.e., using images as input) yields state of the art results -this includes an array of systems that have been trained end-to-end specifically for this task. Our results indicate that a large portion of the error of modern deep 3d pose estimation systems stems from their visual analysis, and suggests directions to further advance the state of the art in 3d human pose estimation.

translated by 谷歌翻译